E 09/890749 04.04.00

# 日本国特許庁

PATENT OFFICE
JAPANESE GOVERNMENT

ROOF F84



別紙添付の書類に記載されている事項は下記の出願書類に記載されている事項と同一であることを証明する。

This is to certify that the annexed is a true copy of the following application as filed with this Office.

出願年月日

Date of Application:

1999年 2月 3日

出願番号

Application Number:

平成11年特許顯第025674号

出 願 人 Applicant (s):

日本電気株式会社

## PRIORITY DOCUMENT

SUBMITTED OR TRANSMITTED IN COMPLIANCE WITH RULE 17.1(a) OR (b)

2000年 3月17日

特 許 庁 長 官 Commissioner, Patent Office 近藤 隆



## 特平11-025674

【書類名】

特許願

【整理番号】

33509432

【提出日】

平成11年 2月 3日

【あて先】

特許庁長官殿

【国際特許分類】

G06F 7/00

【発明者】

【住所又は居所】

東京都港区芝五丁目7番1号 日本電気株式会社内

【氏名】

久村 孝寬

【特許出願人】

【識別番号】

000004237

【氏名又は名称】

日本電気株式会社

【代理人】

【識別番号】

100088812

【弁理士】

【氏名又は名称】

▲柳▼川

信

【手数料の表示】

【予納台帳番号】

030982

【納付金額】

21,000円

【提出物件の目録】

【物件名】

明細書 1

【物件名】

図面 1

【物件名】

要約書 1

【プルーフの要否】

## 【書類名】 明細書

【発明の名称】 信号処理プロセッサ及びそれに用いる丸め機能付き積和演算器 【特許請求の範囲】

【請求項1】 加数と被乗数と乗数との積和演算を行う積和演算器からなる 丸め機能付き積和演算器を含む信号処理プロセッサであって、

前記丸め機能付き積和演算器に接続されたレジスタを有し、

前記丸め機能付き積和演算器は、前記レジスタ内の異なる位置から入力される 加数を選択的に入力する選択入力手段と、前記選択入力手段で選択的に入力され る加数に基づいた前記積和演算器の積和演算結果に対してデータ幅の大きなデー タをデータ幅の小さなデータへ変換する丸め処理を行う丸め処理手段と、前記丸 め処理手段で丸め処理された前記積和演算結果を前記レジスタ内の異なる位置に 選択的に出力する選択出力手段とを含むことを特徴とする信号処理プロセッサ。

【請求項2】 前記レジスタは、外部から読込んだデータを保持するための 複数のレジスタからなることを特徴とする請求項1記載の信号処理プロセッサ。

【請求項3】 前記選択入力手段で選択的に入力される加数に対してデータ幅の小さなデータをデータ幅の大きなデータへ変換する拡張処理を行って前記積和演算器へ入力する拡張処理手段を含むことを特徴とする請求項1または請求項2記載の信号処理プロセッサ。

【請求項4】 前記丸め処理手段は、外部からの丸め指示に応じて前記丸め 処理を実行するよう構成したことを特徴とする請求項1から請求項3のいずれか 記載の信号処理プロセッサ。

【請求項5】 前記選択入力手段は、前記レジスタから入力するデータの前記レジスタ内での位置を外部からの位置指示に応じて決定し、

前記選択出力手段は、前記レジスタへ出力するデータの前記レジスタ内での位置を前記位置指示に応じて決定するよう構成したことを特徴とする請求項1から請求項4のいずれか記載の信号処理プロセッサ。

【請求項6】 加数と被乗数と乗数との積和演算を行う積和演算器を含む丸 め機能付き積和演算器であって、外部に接続されたレジスタ内の異なる位置から 入力される加数を選択的に入力する選択入力手段と、前記選択入力手段で選択的 に入力される加数に基づいた前記積和演算器の積和演算結果に対してデータ幅の 大きなデータをデータ幅の小さなデータへ変換する丸め処理を行う丸め処理手段 と、前記丸め処理手段で丸め処理された前記積和演算結果を前記レジスタ内の異 なる位置に選択的に出力する選択出力手段とを有することを特徴とする丸め機能

【請求項7】 前記レジスタは、外部から読込んだデータを保持するための複数のレジスタからなることを特徴とする請求項6記載の丸め機能付き積和演算器。

【請求項8】 前記選択入力手段で選択的に入力される加数に対してデータ幅の小さなデータをデータ幅の大きなデータへ変換する拡張処理を行って前記積和演算器へ入力する拡張処理手段を含むことを特徴とする請求項6または請求項7記載の丸め機能付き積和演算器。

【請求項9】 前記丸め処理手段は、外部からの丸め指示に応じて前記丸め 処理を実行するよう構成したことを特徴とする請求項6から請求項8のいずれか 記載の丸め機能付き積和演算器。

【請求項10】 前記選択入力手段は、前記レジスタから入力するデータの前記レジスタ内での位置を外部からの位置指示に応じて決定し、

前記選択出力手段は、前記レジスタへ出力するデータの前記レジスタ内での位置を前記位置指示に応じて決定するよう構成したことを特徴とする請求項6から 請求項9のいずれか記載の丸め機能付き積和演算器。

#### 【発明の詳細な説明】

付き積和演算器。

[0001]

【発明の属する技術分野】

本発明は信号処理プロセッサ及びそれに用いる丸め機能付き積和演算器に関し、特に信号処理プロセッサ等で使用する16ビットデータの効率の良い扱いを考慮した丸めつき積和演算回路に関する。

[0002]

『従来の技術》

信号処理プロセッサはメモリからデータを読込んで、加減算、論理演算、乗算といったさまざまな演算を行う。特に、画像処理や音声処理等の信号処理プログラム中に頻繁に現れる積和演算を1サイクルで実行することができる積和演算器を搭載することによって、信号処理プロセッサの処理性能を飛躍的に向上させている。

[0003]

図6に従来の信号処理プロセッサにおける実行ユニット、レジスタ、メモリの 構成例を示す。図6は「IEEE VLSI SIGNAL PROCESSI NG, VI」(pp. 93-101 1993) (以下、文献1とする) におい て紹介された信号処理プロセッサを示している。

[0004]

図6を参照すると、従来の信号処理プロセッサは40ビット幅のレジスタを8個持ち(以下、レジスタ50とする)、積和演算器52と、MUX(マルチプレクサ)53と、ALU(Arithmetic and Logic Unit: 算術及び論理演算器)54と、BSFT(バレルシフトユニット)55と、Xメモリ57xと、Yメモリ57yとを備えている。以下、Xメモリ57x及びYメモリ57yをメモリ57x、57yとする。

[0005]

メモリ57x, 57yとレジスタ50とはデータバス58x, 58yによって接続されている。積和演算器52とALU54とMUX53とBSFT55とはレジスタ50からの出力51a~51cによって接続されている。

[0006]

積和演算器52は積和演算を実行する。ALU54はMUX53によって選択された即値imm.またはレジスタ50の値を使用して算術または論理演算を実行する。BSFT55はMUX53によって選択された即値imm.またはレジスタ50の値を使用して算術または論理シフトを実行する。

[0007]

信号処理プログラムに頻繁に現れる積和演算とは、

 $A = A + B \times C \qquad \dots \qquad (1)$ 



[8000]

被乗数Bと乗数Cとの積を(1)式の右辺の加数Aに加算し、この結果を(1)式の左辺Aとする。(1)式の右辺の加数Aは多くの場合、繰返し実行される 積和演算の結果であるが、メモリから読込むこともある。また、式(1)の右辺の「+」記号を「-」記号に変えた演算も積和演算である。

[0009]

固定小数点の数値データを扱う一般的な積和演算器においては実用性や経済性等の点から、(1)式の右辺の被乗数B、乗数Cを16ビット幅のデータとすることが多い。この場合、被乗数Bと乗数Cとの積は最大で32ビット幅のデータとなるので、(1)式の右辺及び左辺Aは32ビット以上のデータ幅が必要である。

[0010]

以上の理由から、積和演算の結果を保存するために、一般的な信号処理プロセッサでは32ビット以上の幅を持つレジスタを搭載している。このようなプロセッサでレジスタに16ビットデータを保持する時、レジスタの15~0ビットあるいは31~16ビットのどちらかに置くことになる。

[0011]

図6に示した従来の信号処理プロセッサで(1)式の積和演算を実行する場合について、図7を参照して説明する。図7は図6に示した信号処理プロセッサのレジスタ50と積和演算器52とに注目して積和演算を実行する過程を示す図である。

[0012]

まず、プロセッサの外部に接続されたメモリから(1)式の右辺の被乗数Bをレジスタ502に、乗数Cをレジスタ503に、加数Aをレジスタ501にそれぞれ読込む。

[0013]

被乗数B及び乗数Cはレジスタ502,503の31~16ビットまたは15~0ビットのどちらにあってもよいが、ここでは、被乗数Bがレジスタ502の

31~16ビットに、乗数Cがレジスタ503の15~0ビットにあるものとする。加数Aはレジスタの全てのビットを使用する。図7において、レジスタ501~503の下に書かれた数字はビット位置を示す。

## [0014]

続いて、加数Aを積和演算器のACC(アキュームレータ)523に格納する。さらに、被乗数Bと乗数Cとを積和演算器52内にある乗算器521に入力し、これらの積を計算する。被乗数Bと乗数Cとの積は加減算器(±)522によって、ACC523内に格納した加数Aに加算される。最後に、加算結果はACC523に一旦格納され、積和演算器の出力56を通じて加数Aが格納されていたレジスタ501に書戻される。

### [0015]

図6のような構成の信号処理プロセッサ上で、16ビットデータの加数をメモリから読込み、これに対してある積和演算を行って、その結果を再び16ビットデータとしてメモリに保存する処理を考える。つまり、途中の演算結果は別にして、入出力データの幅を16ビットに統一した積和演算である。

#### [0016]

これはある積和演算の被乗数または乗数を別の積和演算の加数として使うという処理を繰返し行う場合に発生する。このような処理では加数、被乗数、乗数が全て16ビットデータとして扱われるので、これらの値によっては演算結果がオーバフローする可能性がある。しかしながら、値の範囲を適切に選ぶことが可能な場合にはオーバフローを起こさずに、演算を実行することが可能である。

#### [0017]

図6に示した従来の信号処理プロセッサで入出力データの幅を16ビットに統一した積和演算を実行する場合について、図8を参照して説明する。図8では図7と同様に、プロセッサの外部に接続されたメモリから被乗数Bをレジスタ502の31~16ビットに、乗数Cをレジスタ503の15~0ビットに、加数Aをレジスタ501の31~16ビットにそれぞれ読込む。

#### [0018]

ここで、16ビットデータである加数Aをレジスタ501に読込む際に、Aの



[0019]

次の状態50n1では積和演算が実行され、A+B×Cがレジスタ501に格納される。また、状態50n2では積和演算の結果40ビットをALU54によって16ビットに丸め、丸めた結果はレジスタ501に格納される。最後に、丸めたデータをメモリに格納する。

[0020]

以上の処理においては二つの問題がある。一つ目の問題はメモリから読込んだ 加数Aのデータ幅と積和演算器 5 2 が要求する加数のデータ幅との相違である。 加数Aは16ビット幅のデータであるから、積和演算を行うためには40ビットのデータ幅に拡張しなければならない。したがって、同一レジスタ内に二つの16ビット加数を置くことができない。

[0021]

二つ目の問題は積和演算器の演算結果のデータ幅とメモリ格納時のデータ幅と の相違である。従来の信号処理プロセッサが備える積和演算器は40ビットのデータ幅をもつ演算結果を出力するので、16ビット幅のデータとしてメモリに格 納する場合、40ビットを16ビットに丸める必要がある。つまり、積和演算に 加えて、丸め処理を行わなければならない。

[0022]

さらに、図6に示す従来の信号処理プロセッサの性能向上を図るために、メモリとレジスタとの間のバス幅を32ビットに増やした場合を考えると、一つのデータバスから16ビットデータを同時に二つ読込むことができる。

[0023]

このような信号処理プロセッサにおいて、再び入出力データの幅を16ビットに統一した積和演算について考えると、被乗数及び乗数は16ビットデータであるから、32ビットの転送能力を活かしてそれぞれを二つずつ同時に読込むことができる。読込まれた二つのデータはレジスタの31~16ビットと15~0ビットとに格納されるものとする。

[0024]

同様に、加数についても32ビット転送によって二つのデータを同時にレジスタに読込むことが可能である。しかしながら、これはうまく機能しない。なぜならば、16ビットデータの加数はレジスタの31~16ビットにあって、15~0ビットは"0"でなければならないからである。

[0025]

つまり、図8において、加数Aが格納されているレジスタ501の15~0ビットに別の加数がある場合、そのままでは正しい演算を実行することができないのである。したがって、加数は一つずつレジスタに読込まなければならない。

[0026]

32ビット転送を使用して加数を同一のレジスタに二つ読込んだ場合には、レジスタ・レジスタ間転送またはシフト等を用いて、別のレジスタに一つずつデータを格納しなければならない。メモリ・レジスタ間の転送命令は半分にすることができても、レジスタ・レジスタ間の転送が必要となるので、この場合、メモリ・レジスタ間の32ビット転送能力が活かされないことになる。

[0027]

【発明が解決しようとする課題】

上述した従来の信号処理プロセッサでは、上記のように、16ビットデータの扱いに問題を抱えている。一つは、入出力データの幅を16ビットに統一した積和演算において、余分な資源を消費してしまうことである。加数の16ビットデータは積和演算器の要求するデータ幅に合わせるためにレジスタの幅に拡張して格納しなければならない。

[0028]

さらに、積和演算の結果はレジスタの幅と同じデータ幅になっているので、1 6ビットのデータにするためには丸め処理が必要である。さらに、この問題によって、メモリ・レジスタ間の転送効率向上が期待できないという問題が引き起こされる。

[0029]

例えば、メモリ・レジスタ間の転送能力を16ビットの倍の32ビット幅に拡

大したとしても、16ビットの加数データを複数個同時にレジスタに読込み、効率よく演算するためにはレジスタ・レジスタ間での加数データの転送が不可欠である。したがって、演算を実行するまでに必要なメモリ・レジスタ間のデータ転送において、効率の向上は期待できない。

### [0030]

そこで、本発明の目的は上記の問題点を解消し、16ビットデータの効率の良い扱いを考慮した信号処理プロセッサ及びそれに用いる丸め機能付き積和演算器を提供することにある。さらに詳しく言うと、レジスタの中での加数の位置を考慮した16ビットの積和演算を実行可能な信号処理プロセッサ及びそれに用いる丸め機能付き積和演算器を提供することにある。

## [0031]

## 【課題を解決するための手段】

本発明による信号処理プロセッサは、加数と被乗数と乗数との積和演算を行う 積和演算器からなる丸め機能付き積和演算器を含む信号処理プロセッサであって 、前記丸め機能付き積和演算器に接続されたレジスタを備え、

前記丸め機能付き積和演算器は、前記レジスタ内の異なる位置から入力される 加数を選択的に入力する選択入力手段と、前記選択入力手段で選択的に入力され る加数に基づいた前記積和演算器の積和演算結果に対してデータ幅の大きなデー タをデータ幅の小さなデータへ変換する丸め処理を行う丸め処理手段と、前記丸 め処理手段で丸め処理された前記積和演算結果を前記レジスタ内の異なる位置に 選択的に出力する選択出力手段とを具備している。

## [0032]

本発明による丸め機能付き積和演算器は、加数と被乗数と乗数との積和演算を行う積和演算器からなる丸め機能付き積和演算器であって、外部に接続されたレジスタ内の異なる位置から入力される加数を選択的に入力する選択入力手段と、前記選択入力手段で選択的に入力される加数に基づいた前記積和演算器の積和演算結果に対してデータ幅の大きなデータをデータ幅の小さなデータへ変換する丸め処理を行う丸め処理手段と、前記丸め処理手段で丸め処理された前記積和演算結果を前記レジスタ内の異なる位置に選択的に出力する選択出力手段とを備えて

いる。

## [0033]

すなわち、本発明の丸め機能付き積和演算器は、選択入力及び拡張手段と、丸め及び選択出力手段と、積和演算器とを備える。丸め機能付き積和演算器は制御信号Round, Positionによってその動作を決定する。制御信号Roundが"0"の場合、本発明の丸め機能付き積和演算器は従来の積和演算器として動作する。

## [0034]

制御信号Roundが"1"の場合、本発明の丸め機能付き積和演算器の動作は制御信号Positionによって異なる。選択入力及び拡張手段は外部に接続されたレジスタにおける16ビットデータである加数の位置を制御信号Positionで与えることによって、加数を積和演算器が要求するデータ幅に拡張する。

## [0035]

丸め及び選択出力手段は積和演算の結果として得られるレジスタ幅のデータを 16ビットに丸め処理した後、制御信号Positionが示すレジスタにおけ る加数の位置に丸め処理したデータを出力する。

## [0036]

このような構成によって、丸め機能付き積和演算器の外部に接続された32ビット以上の幅をもつレジスタ内の31~16ビットあるいは15~0ビットにある16ビット幅の加数に対して、互いに影響を与えずに丸め付き積和演算を実行することが可能となる。

## [0037]

## 【発明の実施の形態】

次に、本発明の実施の形態について図面を参照して説明する。図1は本発明の 実施の形態の構成を示すブロック図である。同図において、丸め機能付き積和演算器 算器4は16ビットデータの効率の良い扱いを考慮した丸め機能付き積和演算器 である。さらに詳しく言うと、32ビット以上の幅をもつレジスタ1内に二つの 別々の16ビットデータがある場合に、互いのデータに影響を与えないような積



[0038]

丸め機能付き積和演算器4は外部にレジスタを接続して動作させる。丸め機能 付き積和演算器4は外部のレジスタから加数、被乗数、乗数の三つのデータを取 込む。また、丸め機能付き積和演算器4は演算の結果を書出す出力を三つ備えて いる。さらに、丸め機能付き積和演算器4は演算の動作を決定する制御信号を二 つ持つ。

[0039]

加数は丸め機能付き積和演算器4の外部に接続された40ビットレジスタ1の31~16ビットあるいは15~0ビットに格納されている。被乗数及び乗数は外部のレジスタに格納されており、丸め機能付き積和演算器4に入力される。

[0040]

図1では加数が格納されている40ビットレジスタ1のみを示し、被乗数や乗数が格納されているレジスタは示していない。40ビットレジスタ1に格納されたデータは15~0ビットが入力データ46L、31~16ビットが入力データ46H、39~32ビットが入力データ46Eとして丸め機能付き積和演算器4に入力される。また、被乗数は16ビットデータ45、乗数は16ビットデータ44として丸め機能付き積和演算器4へ入力される。

[0041]

加数と被乗数と乗数との積和演算及び丸め処理の結果は出力47L,47H,47Eとして40ビットレジスタ1へ書戻される。出力47L,47Hは16ビットデータであり、出力47Eは8ビットデータである。出力47Lは40ビットレジスタ1の15~0ビットへ、出力47Hは40ビットレジスタ1の31~16ビットへ、出力47Eは40ビットレジスタ1の39~32ビットへそれぞれ出力される。

[0042]

丸め機能付き積和演算器4の動作を制御するのは二つの制御信号Round, Positionである。制御信号Positionは40ビットレジスタ1に おける加数の位置を示す信号である。加数が40ビットレジスタ1の31~16 ビットにある場合に制御信号Position=1、 $15\sim0$ ビットにある場合に制御信号Position=0とする。

### [0043]

制御信号Roundは丸め機能付き積和演算器4において丸め処理を行うかどうかを決める信号である。ここで、丸め処理とはデータ幅の大きなデータをデータ幅の小さなデータへ変換する操作である。この逆の操作、つまりデータ幅の小さなデータをデータ幅の大きなデータへ変換する操作を拡張処理と呼ぶことにする。丸め処理を行う場合は制御信号Round=1、丸め処理を行わない場合は制御信号Round=0とする。

## [0044]

さらに、図1の丸め機能付き積和演算器4の内部構成について説明する。丸め機能付き積和演算器4は積和演算器41と、選択入力及び拡張手段42と、丸め及び選択出力手段43とからなる。

## [0045]

選択入力及び拡張手段42はレジスタ1からの入力データ46E,46H,46Lからデータを選択して拡張し、40ビットデータを出力する。また、選択入力及び拡張手段42は制御信号Position,Roundによって制御される。積和演算器41は選択入力及び拡張手段42によって得られる加数と乗数44と被乗数45とによる積和演算を実行する。

#### [0046]

丸め及び選択出力手段43は積和演算器41の出力を40ビットから16ビットへ丸めて、40ビットレジスタ1の指定された位置へ出力する。また、丸め及び選択出力手段43は制御信号Position,Roundによって制御される。

## [0047]

本発明の丸め機能付き積和演算器4は従来の積和演算器41に、選択入力及び 拡張手段42と丸め及び選択出力手段43とを加えることによって16ビットデータの扱いを改善したものである。

#### [0048]

次に、図1を参照して本発明の丸め機能付き積和演算器4の動作について説明する。選択入力及び拡張手段42は40ビットレジスタ1から入力される入力データ46E,46H,46Lに基づいて40ビットデータ48を構成する。これは制御信号Round,Positionによって制御される。

### [0049]

制御信号Roundが"0"の場合は丸め処理を行わないので、丸め機能付き 積和演算器4は従来の積和演算器と同じ演算結果が得られるように動作しなけれ ばならない。この時、40ビットレジスタ1から入力される入力データ46E, 46H, 46Lはそのまま40ビットデータとして積和演算器41へ出力される

### [0050]

一方、制御信号Roundが"1"の場合は制御信号Positionによって動作が異なる。制御信号Roundが-"1"で、制御信号Positionが"0"の場合には、加数が40ビットレジスタ1の15~0ビットにあるものとして処理を行う。この場合、40ビットレジスタ1の15~0ビットにある加数46Lを40ビットに拡張して積和演算器41へ出力する。

## [0051]

制御信号Roundが"1"で、制御信号Positionが"1"の場合には、加数が40ビットレジスタ1の31~16ビットにあるものとして処理を行う。この場合、40ビットレジスタ1の31~16ビットにある加数46Hを40ビットに拡張して積和演算器41へ出力する。

### [0052]

積和演算器41は16ビットデータ44,45の積を計算し、これを40ビットデータ48に加算した結果を、同じく40ビットデータ49として出力する。最後に、丸め及び選択出力手段43は積和演算器41で計算された積和演算の結果である40ビットデータ49に丸め処理を行って、16ビットデータとして40ビットレジスタ1へ出力する。ここで、丸め処理を行うかどうかは制御信号Roundによって決定する。丸めた16ビットデータを40ビットレジスタ1のどの部分に出力するかは制御信号Positionによって決定する。制御信号

Roundが "0" の場合には丸め処理を行わずに40ビットデータ49を出力 47E, 47H, 47Lにわけてレジスタ1へ出力する。

## [0053]

制御信号Roundが"1"で、制御信号Positionが"0"の場合には加数が40ビットレジスタ1の15~0ビットにあるので、40ビットデータ49に丸め処理を施して16ビットデータとし、これを出力47Lとして40ビットレジスタ1の15~0ビットに出力する。この時、出力47H,47Eは動作しないので、40ビットレジスタ1の39~16ビットは変化しない。

## [0054]

制御信号Roundが"1"で、制御信号Positionが"1"の場合には加数が40ビットレジスタ1の31~16ビットにあるので、40ビットデータ49に丸め処理を施して16ビットデータとし、これを出力47Hとして40ビットレジスタ1の31~16ビットに出力する。この時、出力47L,47Eは動作しないので、40ビットレジスタ1の39~32ビット及び15~0ビットは変化しない。

### [0055]

図2は図1の選択入力及び拡張手段42の動作を示す図である。この図2を参照して選択入力及び拡張手段42の動作について説明する。選択入力及び拡張手段42の目的は丸め処理の有無、積和演算に必要な加数の40ビットレジスタ1における位置を考慮し、40ビットレジスタ1から40ビットデータを作成することである。

#### [0056]

選択入力及び拡張手段42における丸め処理の有無は制御信号Roundによって決定し、加数の40ビットレジスタ1における位置は制御信号Positionによって決定する。

#### [0057]

例えば、制御信号Roundが"0"である場合、制御信号Positionが何であろうと、40ビットレジスタ1から入力された入力データ46E,46 H,46Lによって40ビットデータ48を構成して出力する。この場合、16 ビットデータ46Lは40ビットデータ48の15~0ビット、16ビットデータ46Hは同じく40ビットデータ48の31~16ビット、8ビットデータ46Eは同じく40ビットデータ48の39~32ビットとなる。

[0058]

一方、制御信号Roundが"1"である場合には、制御信号Positionによって動作が異なる。制御信号Roundが"1"でかつ制御信号Positionが"0"である場合、加数は40ビットレジスタ1の15~0ビットにある。そこで、40ビットレジスタ1の15~0ビットにある16ビットデータ46Lを40ビット幅のデータへ拡張し、40ビットデータ48とする。

[0059]

制御信号Roundが"1"でかつ制御信号Positionが"1"である場合、加数は40ビットレジスタ1の31~16ビットにある。そこで、40ビットレジスタ1の31~16ビットにある16ビットデータ46Hを40ビット幅のデータへ拡張し、40ビットデータ48とする。

[0060]

固定小数点データの場合、16ビットデータ46Lまたは16ビットデータ46Hから40ビットデータ48への拡張は次のようにして行う。まず、拡張する16ビットデータを40ビットデータ48の31~16ビットとする。

[0061]

さらに、拡張する16ビットデータの符号ビットを取出し、その符号ビットを40ビットデータ48の39~32ビットとする。通常、符号ビットは1ビットの情報であるから、40ビットデータ48の39~32ビットには符号ビットが繰返し挿入される。最後に、40ビットデータ48の15~0ビットに0を挿入する。

[0062]

図3は図1の丸め及び選択出力手段43の動作を示す図である。この図3を参照して丸め及び選択出力手段43の動作について説明する。丸め及び選択出力手段43へは積和演算器41から演算結果49が入力される。

[0063]

丸め及び選択出力手段43の目的は丸め処理の有無、積和演算に使用した加数の40ビットレジスタ1における位置を考慮し、入力40ビットデータ49を40ビットレジスタ1へ出力することである。

## [0064]

丸め及び選択出力手段43における丸め処理の有無は制御信号Roundによって決定し、加数のレジスタ1における位置は制御信号Positionによって決定する。

## [0065]

例えば、制御信号Roundが"0"である場合、制御信号Positionが何であろうと、丸め処理を行わずに入力40ビットデータ49をそのまま40ビットレジスタ1へ出力する。

### [0066]

この時、16ビット出力データ47Lは入力40ビットデータ49の15~0 ビット、16ビット出力データ47Hは同じく入力40ビットデータ49の31 ~16ビット、8ビット出力データ47Eは同じく入力40ビットデータ49の 39~32ビットとなる。

#### [0067]

一方、制御信号Roundが"1"である場合、制御信号Positionによって動作が異なる。制御信号Roundが"1"でかつ制御信号Positionが"0"である場合、加数は40ビットレジスタ1の15~0ビットにある。そこで、丸め及び選択出力手段43は入力40ビットデータ49に丸め処理を行って16ビットデータとし、これを出力47Lとする。これは40ビットレジスタ1の15~0ビットに書込まれる。この時、出力47H及び出力47Eは何も出力しない。

#### [0068]

制御信号Roundが"1"でかつ制御信号Positionが"1"である場合、加数は40ビットレジスタ1の31~16ビットにある。そこで、丸め及び選択出力手段43は入力40ビットデータ49に丸め処理を行って16ビットデータとし、これを出力47Hとする。これは40ビットレジスタ1の31~1

6ビットに書込まれる。この時、出力47L及び出力47Eは何も出力しない。

[0069]

尚、本発明の実施の形態では40ビットレジスタ1のデータ幅が40ビットの場合について述べたが、そのデータ幅が32ビットの場合にも適用可能である。 その場合、入力46Eと出力47Eとが不要となる。

[0070]

さらに、本発明の実施の形態ではレジスタ幅とデータサイズとを変えることで、 $Mビット幅のレジスタで、N \leq M / 2$ なるNビットのデータを扱うように修正することも可能である。この場合、図1において、<math>1はMビット幅のレジスタ、2,3,44,45,46H,46L,47H,47Lは<math>Nビット幅のデータ、46E,47EはM-2Nビット幅のデータ、48,49は<math>Mビット幅のデータとなる。

[0071]

積和演算器41はNビットデータ44,45の積を計算し、選択入力及び拡張手段42から受取ったMビットデータ48に加算する。その演算結果49は丸め及び選択出力手段43によって丸め処理され、Nビットデータとしてレジスタ1に書戻される。選択入力及び拡張手段42及び丸め及び選択出力手段43の動作はそれぞれ図2及び図3において、ビット位置を示す数字39をM-1に、同じく32を2Nに、31を2N-1に、16をNに、15をN-1に変更したものとなる。但し、M=2Nの場合には入力46Eと出力47Eとが不要となる。

[0072]

図4は本発明の一実施例による丸め機能付き積和演算器の構成を示すブロック図である。図においては外部に40ビットレジスタ61~63を接続し、かつMUX(マルチプレクサ)64,65によってレジスタ61~63の31~16ビットあるいは15~0ビットのどちらかを選択して丸め機能付き積和演算器4に入力できるようにした構成例を示している。この図4において、レジスタ61~63はメモリ(図示せず)からデータを読込んだり、メモリヘデータを保存することができるものとする。

[0073]

図5は図4の丸め機能付き積和演算器4を使用して加数、被乗数、乗数の全てが16ビットデータである積和演算を実行した場合のレジスタの状態を示す図である。これら図4及び図5を参照して丸め機能付き積和演算器4の動作について説明する。

[0074]

レジスタ61には「A」及び「D」の16ビットデータがメモリから読込まれた状態にある。レジスタ61の31~16ビットには加数Aが、15~0ビットには別の加数Dが格納されている。

[0075]

この状態で、まず $A=A+B\times C$ という積和演算を実行する。ここで、丸め機能付き積和演算器 4 への制御信号R o u n d = 1 、制御信号P o s i t i o n = 1 とする。

[0076]

丸め機能付き積和演算器4はレジスタ61から加数Aを取込み、レジスタ62からMUX64によって選択された被乗数Bと、レジスタ63からMUX65によって選択された乗数Cとによって積和演算と丸め処理とを行う。その結果は再びレジスタ61に書戻される。この時、レジスタ61の31~16ビットに演算結果が書込まれ、レジスタ61の15~0ビットは変化しない。この状態を6n1とする。

[0077]

次に、D=D+E×Fという積和演算を実行する。ここで、丸め機能付き積和 演算器4への制御信号Round=1、制御信号Position=0とする。 丸め機能付き積和演算器4はレジスタ61から加数Dを取込み、レジスタ62からMUX64によって選択された被乗数Eと、レジスタ63からMUX65によって選択された乗数Fとによって積和演算と丸め処理とを行う。その結果は再びレジスタ61に書戻される。この時、レジスタ61の15~0ビットに演算結果が書込まれ、レジスタ61の31~16ビットは変化しない。この状態を6n2とする。

[0078]

状態6n2のレジスタ61には $A+B\times C$ と $D+E\times F$ との演算結果が16ビットに丸めて $31\sim16$ ビットと $15\sim0$ ビットとにそれぞれ格納されており、そのままメモリへ保存することが可能となる。

[0079]

図4ではレジスタ61は46L,46H,46E,47E,47H,47Lと、レジスタ62はMUX64を介して被乗数16ビットデータ45と、レジスタ63もMUX65を介して乗数16ビットデータ44と固定的に接続されているが、これらの組合せを自由に選択可能なように修正することは容易である。

[0800]

これは本発明の一実施例による丸め機能付き積和演算器4を、複数のレジスタをもつ信号処理プロセッサで使用する場合に特に有効である。もちろん、信号処理プロセッサに含まれない回路として本発明の一実施例による丸め機能付き積和 演算器4を使用することも可能である。

[0081]

本発明の一実施例による丸め機能付き積和演算器4を使用すれば、図5に示したように、レジスタ内の31~16ビットあるいは15~0ビットにある16ビット幅の加数に対して、他のビットに影響を与えずに積和演算を実行することが可能となる。この効果によって、レジスタ内に異なる16ビット幅の加数を混在させることが可能となる。この効果は積和演算に使用するレジスタ数の削減につながる。

[0082]

さらに、本発明の一実施例による丸め機能付き積和演算器4を32ビット幅以上のレジスタをもつ信号処理プロセッサに搭載した場合、2つの16ビット幅の加数をメモリから同時に読込み、一つのレジスタ内に混在させても正しく積和演算を実行することができるため、レジスタ・メモリ間の32ビット転送を活かすことができる。

[0083]

以上のことを、LMS(Least Mean Square)適応フィルタの実装を例にとって示す。LMS適応フィルタは時刻iにおける入力信号をxi

とするタップ数TのFIR (Finite Impulse Response) フィルタ (係数 $w_j$  ) (j=0, 1, ……, T-1) の出力 $y_i$  と所望信号 $d_i$  との誤差 $e_i$  によって、FIRフィルタの係数を勾配法を用いて適応的に更新するものである。 $y_i$  の計算と $w_i$  の更新式とは、

$$y_{i} = \sum x_{i-j} w_{j} \qquad \cdots (2)$$

$$e_{i} = d_{i} - y_{i} \qquad \cdots (3)$$

$$w_{j} = w_{j} + \mu e_{i} x_{i-j} \qquad \cdots (4)$$

という式で表される。但し、 $\Sigma$ はj=0からj=T-1の総和であり、 $\mu$ は非常に小さな正の定数であり、j=0, 1, ……, T-1である。

[0084]

- (4) 式を参照すると、μe<sub>i</sub> は一度計算しておけば全ての係数について同じ値を使用することができる。そのため、(4) 式のフィルタ係数の更新において係数毎に必要となる基本操作は、
  - (1) メモリから $x_{i-i}$  を読込む
  - (2) メモリから $\mathbf{w}_{j}$  を読込む
  - (3) 加数 $\mathbf{w}_{\mathbf{j}}$  、被乗数 $\mu \, \mathbf{e}_{\mathbf{i}}$  、乗数 $\mathbf{x}_{\mathbf{i}-\mathbf{j}}$  による積和演算  $\mathbf{w}_{\mathbf{j}} = \mathbf{w}_{\mathbf{j}} + \mu \, \mathbf{e}_{\mathbf{i}} \quad \mathbf{x}_{\mathbf{i}-\mathbf{j}}$
- (4)  $\mathbf{w}_{\mathbf{j}}$  をメモリへ保存 という四つの処理であることがわかる。

[0085]

信号処理プロセッサでこれら四つの処理を行う場合、 $x_{i-j}$  ,  $w_j$  ,  $e_i$  は 16 ビットデータ、 $y_i$  は 32 ビット以上のデータとする場合が多い。これ は信号処理プロセッサに搭載された積和演算器の仕様によるものである。 $x_{i-j}$  ,  $w_j$  ,  $e_i$  ,  $y_i$  を上記のようなデータ幅とした時、 $w_j$  が加数となる (3) の積和演算はデータ幅を 16 ビットに統一した演算になる。

[0086]

上記の基本操作において、(1)と(2)と(4)とのメモリ・レジスタ間の 転送は16ビットデータの転送であるから、32ビット幅のデータバスをもつ信 号処理プロセッサならば、二つのイタレーションの転送をまとめて一回で行うこ



とができる。

[0087]

(2)のW<sub>j</sub> の読込みに32ビット転送を使用した場合、読込まれた二つのデータはレジスタの31~16ビットと15~0ビットとに格納される。従来の積和演算器を搭載するプロセッサでは、このような配置で格納されたW<sub>j</sub> をそのままの状態で演算することは不可能だが、本発明の一実施例による丸め機能付き積和演算器4を搭載した信号処理プロセッサならば、すぐに積和演算を実行することができる。その結果、W<sub>j</sub> をメモリへ保存する(4)の処理においても、演算後すぐに32ビット転送を使用することができる。

[0088]

以上のようにして、32ビット幅のデータバスをもつ信号処理プロセッサで16ビットデータの積和演算を実行する場合でも、本発明一実施例による丸め機能付き積和演算器4を使用することによって、メモリ・レジスタ間の32ビット転送を活かすことができる。

[0089]

【発明の効果】

以上説明したように本発明によれば、加数と被乗数と乗数との積和演算を行う 積和演算器からなる丸め機能付き積和演算器において、外部に接続されたレジス タ内の異なる位置から入力される加数を選択的に入力し、選択的に入力される加 数に基づいた積和演算器の積和演算結果に対してデータ幅の大きなデータをデー タ幅の小さなデータへ変換する丸め処理を行い、その丸め処理された積和演算結 果をレジスタ内の異なる位置に選択的に出力することによって、レジスタの中で の加数の位置を考慮した16ビットの積和演算を実行することができるという効 果がある。

【図面の簡単な説明】

【図1】

本発明の実施の形態の構成を示すブロック図である。

【図2】

図1の選択入力及び拡張手段の動作を示す図である。

## 【図3】

図1の丸め及び選択出力手段の動作を示す図である。

#### 【図4】

本発明の一実施例による丸め機能付き積和演算器の構成を示すブロック図である。

### 【図5】

図4の丸め機能付き積和演算器を使用して加数、被乗数、乗数の全てが16ビットデータである積和演算を実行した場合のレジスタの状態を示す図である。

#### 【図6】

従来の信号プロセッサの構成例を示すブロック図である。

### 【図7】

従来の信号プロセッサによる加数が40ビットデータで、被乗数及び乗数が1 6ビットデータである積和演算の実行例を示すブロック図である。

## 【図8】

従来の信号プロセッサによる加数、被乗数、乗数の全てが16ビットデータで ある積和演算を実行した場合のレジスタの状態を示す図である。

#### 【符号の説明】

- 1,61~63 40ビットレジスタ
  - 2,3 16ビットデータ
    - 4 丸め機能付き積和演算器
    - 41 積和演算器
    - 42 選択入力及び拡張手段
    - 43 丸め及び選択出力手段
  - 64,65 マルチプレクサ
    - A 加数
    - B 被乗数
    - C 乗数



【書類名】

図面

[図1]



## 【図2】

| 制御信号  |          | 16:71                            |  |  |
|-------|----------|----------------------------------|--|--|
| Round | Position |                                  |  |  |
| 0     | 0        | レジスタ1の39~0ピットをそのまま出力する           |  |  |
| 0     | 1        |                                  |  |  |
| 1     | 0        | レジスタ1の15~0ピットを40ピットデータへ拡張して出力する  |  |  |
| 1     | 1        | レジスタ1の31~16ビットを40ビットデータへ拡張して出力する |  |  |

## 【図3】

| 制御信号  |          | 出力                   |                                |                                | 備考                                     |
|-------|----------|----------------------|--------------------------------|--------------------------------|----------------------------------------|
| Round | Position | 出力47E                | 出力47日                          | 出力47し                          | 1845                                   |
| 0     | 0        | 入力データ49の<br>39~32ピット | 人力データ49の<br>31~16ビット           | 入力データ49の<br>15~0 ビット           | 人力データ49を丸め<br>処理をせずそのまま<br>レジスタ1へ出力    |
| 0     | 1        |                      |                                |                                |                                        |
| 1     | 0        | 何も出力しない              | 何も出力しない                        | 人力データ49を<br>丸め処理した16<br>ビットデータ | 入力データ49を丸め<br>処理してレジスタ1<br>15~0 ビットへ出力 |
| 1     | 1        | 何も出力しない              | 入力データ49を<br>丸め処理した16<br>ビットデータ | 何も出力しない                        | 入力データ49を丸め<br>処理してレジスタ1<br>31~16ビットへ出力 |

【図4】



【図5】



【図6】



## 【図7】



【図8】



【書類名】 要約書

【要約】

【課題】 レジスタの中での加数の位置を考慮した16ビットの積和演算を実行可能な丸め機能付き積和演算器を提供する。

【解決手段】 丸め機能付き積和演算器4の選択入力及び拡張手段42は外部からの制御信号Positionが"1"であれば40ビットレジスタ1の31~16ビットにあるデータを、制御信号Positionが"0"であれば40ビットレジスタ1の15~0ビットにあるデータをそれぞれ40ビットに拡張して積和演算器41へ渡す。積和演算器41は40ビットデータと16ビットデータ被乗数Bと乗数Cとによって積和演算を実行する。丸め処理及び選択出力手段43は外部からの制御信号Roundが"1"の場合に40ビットデータを16ビットに丸め、制御信号Positionが示す40ビットレジスタ1における加数の位置に丸め処理したデータを出力する。

【選択図】 図1

## 特平11-025674

## 出願人履歴情報

識別番号

[000004237]

1. 変更年月日 1990年 8月29日

[変更理由] 新規登録

住 所 東京都港区芝五丁目7番1号

氏 名 日本電気株式会社